{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "   MEMBER_NO    FFP_DATE FIRST_FLIGHT_DATE GENDER  FFP_TIER    WORK_CITY  \\\n",
      "0      54993  2006/11/02        2008/12/24      男         6            .   \n",
      "1      28065  2007/02/19        2007/08/03      男         6          NaN   \n",
      "2      55106  2007/02/01        2007/08/30      男         6            .   \n",
      "3      21189  2008/08/22        2008/08/23      男         5  Los Angeles   \n",
      "4      39546  2009/04/10        2009/04/15      男         6           贵阳   \n",
      "\n",
      "  WORK_PROVINCE WORK_COUNTRY   AGE   LOAD_TIME  ...  ADD_Point_SUM  \\\n",
      "0            北京           CN  31.0  2014/03/31  ...          39992   \n",
      "1            北京           CN  42.0  2014/03/31  ...          12000   \n",
      "2            北京           CN  40.0  2014/03/31  ...          15491   \n",
      "3            CA           US  64.0  2014/03/31  ...              0   \n",
      "4            贵州           CN  48.0  2014/03/31  ...          22704   \n",
      "\n",
      "   Eli_Add_Point_Sum  L1Y_ELi_Add_Points  Points_Sum  L1Y_Points_Sum  \\\n",
      "0             114452              111100      619760          370211   \n",
      "1              53288               53288      415768          238410   \n",
      "2              55202               51711      406361          233798   \n",
      "3              34890               34890      372204          186100   \n",
      "4              64969               64969      338813          210365   \n",
      "\n",
      "   Ration_L1Y_Flight_Count  Ration_P1Y_Flight_Count  Ration_P1Y_BPS  \\\n",
      "0                 0.509524                 0.490476        0.487221   \n",
      "1                 0.514286                 0.485714        0.489289   \n",
      "2                 0.518519                 0.481481        0.481467   \n",
      "3                 0.434783                 0.565217        0.551722   \n",
      "4                 0.532895                 0.467105        0.469054   \n",
      "\n",
      "  Ration_L1Y_BPS  Point_NotFlight  \n",
      "0       0.512777               50  \n",
      "1       0.510708               33  \n",
      "2       0.518530               26  \n",
      "3       0.448275               12  \n",
      "4       0.530943               39  \n",
      "\n",
      "[5 rows x 44 columns]\n",
      "                         count unique         top   freq      mean       std  \\\n",
      "MEMBER_NO                62988    NaN         NaN    NaN   31494.5   18183.2   \n",
      "FFP_DATE                 62988   3068  2011/01/13    184       NaN       NaN   \n",
      "FIRST_FLIGHT_DATE        62988   3406  2013/02/16     96       NaN       NaN   \n",
      "GENDER                   62985      2           男  48134       NaN       NaN   \n",
      "FFP_TIER                 62988    NaN         NaN    NaN   4.10216  0.373856   \n",
      "WORK_CITY                60719   3310          广州   9385       NaN       NaN   \n",
      "WORK_PROVINCE            59740   1185          广东  17507       NaN       NaN   \n",
      "WORK_COUNTRY             62962    118          CN  57748       NaN       NaN   \n",
      "AGE                      62568    NaN         NaN    NaN   42.4763   9.88591   \n",
      "LOAD_TIME                62988      1  2014/03/31  62988       NaN       NaN   \n",
      "FLIGHT_COUNT             62988    NaN         NaN    NaN   11.8394   14.0495   \n",
      "BP_SUM                   62988    NaN         NaN    NaN   10925.1   16339.5   \n",
      "EP_SUM_YR_1              62988    NaN         NaN    NaN         0         0   \n",
      "EP_SUM_YR_2              62988    NaN         NaN    NaN    265.69    1645.7   \n",
      "SUM_YR_1                 62437    NaN         NaN    NaN   5355.38   8109.45   \n",
      "SUM_YR_2                 62850    NaN         NaN    NaN   5604.03   8703.36   \n",
      "SEG_KM_SUM               62988    NaN         NaN    NaN   17123.9   20960.8   \n",
      "WEIGHTED_SEG_KM          62988    NaN         NaN    NaN   12777.2   17578.6   \n",
      "LAST_FLIGHT_DATE         62988    731  2014/03/31    959       NaN       NaN   \n",
      "AVG_FLIGHT_COUNT         62988    NaN         NaN    NaN   1.54215     1.787   \n",
      "AVG_BP_SUM               62988    NaN         NaN    NaN   1421.44   2083.12   \n",
      "BEGIN_TO_FIRST           62988    NaN         NaN    NaN   120.145   159.573   \n",
      "LAST_TO_END              62988    NaN         NaN    NaN    176.12   183.822   \n",
      "AVG_INTERVAL             62988    NaN         NaN    NaN   67.7498   77.5179   \n",
      "MAX_INTERVAL             62988    NaN         NaN    NaN   166.034   123.397   \n",
      "ADD_POINTS_SUM_YR_1      62988    NaN         NaN    NaN   540.317   3956.08   \n",
      "ADD_POINTS_SUM_YR_2      62988    NaN         NaN    NaN   814.689    5121.8   \n",
      "EXCHANGE_COUNT           62988    NaN         NaN    NaN  0.319775     1.136   \n",
      "avg_discount             62988    NaN         NaN    NaN  0.721558  0.185427   \n",
      "P1Y_Flight_Count         62988    NaN         NaN    NaN   5.76626   7.21092   \n",
      "L1Y_Flight_Count         62988    NaN         NaN    NaN   6.07316   8.17513   \n",
      "P1Y_BP_SUM               62988    NaN         NaN    NaN   5366.72   8537.77   \n",
      "L1Y_BP_SUM               62988    NaN         NaN    NaN   5558.36   9351.96   \n",
      "EP_SUM                   62988    NaN         NaN    NaN    265.69    1645.7   \n",
      "ADD_Point_SUM            62988    NaN         NaN    NaN   1355.01   7868.48   \n",
      "Eli_Add_Point_Sum        62988    NaN         NaN    NaN    1620.7    8294.4   \n",
      "L1Y_ELi_Add_Points       62988    NaN         NaN    NaN   1080.38   5639.86   \n",
      "Points_Sum               62988    NaN         NaN    NaN   12545.8   20507.8   \n",
      "L1Y_Points_Sum           62988    NaN         NaN    NaN   6638.74   12601.8   \n",
      "Ration_L1Y_Flight_Count  62988    NaN         NaN    NaN  0.486419  0.319105   \n",
      "Ration_P1Y_Flight_Count  62988    NaN         NaN    NaN  0.513581  0.319105   \n",
      "Ration_P1Y_BPS           62988    NaN         NaN    NaN  0.522293  0.339632   \n",
      "Ration_L1Y_BPS           62988    NaN         NaN    NaN  0.468422  0.338956   \n",
      "Point_NotFlight          62988    NaN         NaN    NaN   2.72815   7.36416   \n",
      "\n",
      "                          min       50%       max  \n",
      "MEMBER_NO                   1   31494.5     62988  \n",
      "FFP_DATE                  NaN       NaN       NaN  \n",
      "FIRST_FLIGHT_DATE         NaN       NaN       NaN  \n",
      "GENDER                    NaN       NaN       NaN  \n",
      "FFP_TIER                    4         4         6  \n",
      "WORK_CITY                 NaN       NaN       NaN  \n",
      "WORK_PROVINCE             NaN       NaN       NaN  \n",
      "WORK_COUNTRY              NaN       NaN       NaN  \n",
      "AGE                         6        41       110  \n",
      "LOAD_TIME                 NaN       NaN       NaN  \n",
      "FLIGHT_COUNT                2         7       213  \n",
      "BP_SUM                      0      5700    505308  \n",
      "EP_SUM_YR_1                 0         0         0  \n",
      "EP_SUM_YR_2                 0         0     74460  \n",
      "SUM_YR_1                    0      2800    239560  \n",
      "SUM_YR_2                    0      2773    234188  \n",
      "SEG_KM_SUM                368      9994    580717  \n",
      "WEIGHTED_SEG_KM             0   6978.26    558440  \n",
      "LAST_FLIGHT_DATE          NaN       NaN       NaN  \n",
      "AVG_FLIGHT_COUNT         0.25     0.875    26.625  \n",
      "AVG_BP_SUM                  0   752.375   63163.5  \n",
      "BEGIN_TO_FIRST              0        50       729  \n",
      "LAST_TO_END                 1       108       731  \n",
      "AVG_INTERVAL                0   44.6667       728  \n",
      "MAX_INTERVAL                0       143       728  \n",
      "ADD_POINTS_SUM_YR_1         0         0    600000  \n",
      "ADD_POINTS_SUM_YR_2         0         0    728282  \n",
      "EXCHANGE_COUNT              0         0        46  \n",
      "avg_discount                0  0.711856       1.5  \n",
      "P1Y_Flight_Count            0         3       118  \n",
      "L1Y_Flight_Count            0         3       111  \n",
      "P1Y_BP_SUM                  0      2692    246197  \n",
      "L1Y_BP_SUM                  0      2547    259111  \n",
      "EP_SUM                      0         0     74460  \n",
      "ADD_Point_SUM               0         0    984938  \n",
      "Eli_Add_Point_Sum           0         0    984938  \n",
      "L1Y_ELi_Add_Points          0         0    728282  \n",
      "Points_Sum                  0    6328.5    985572  \n",
      "L1Y_Points_Sum              0    2860.5    728282  \n",
      "Ration_L1Y_Flight_Count     0       0.5         1  \n",
      "Ration_P1Y_Flight_Count     0       0.5         1  \n",
      "Ration_P1Y_BPS              0  0.514252  0.999989  \n",
      "Ration_L1Y_BPS              0  0.476747  0.999993  \n",
      "Point_NotFlight             0         0       140  \n"
     ]
    }
   ],
   "source": [
    "# -*- coding:utf-8 -*-\n",
    "# 7.2 数据探索\n",
    "#对数据进行基本的探索\n",
    "#返回缺失值个数以及最大最小值\n",
    "import pandas as pd\n",
    "\n",
    "datafile = 'air_data.csv'#航空公司原始数据，第一行是属性名\n",
    "\n",
    "result = 'explore.xlsx'\n",
    "\n",
    "data = pd.read_csv(datafile, encoding='utf-8')\n",
    "#print(data.head())\n",
    "explore = data.describe( percentiles = [],include = 'all').T\n",
    "print(explore)\n",
    "explore['null'] = len(data)-explore['count']\n",
    "\n",
    "\n",
    "explore1 = explore[['null','max','min']]\n",
    "explore1.columns = [u'空值数',u'最大值',u'最小值']#重命名列名\n",
    "\n",
    "explore1.to_excel(result)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "collapsed": true
   },
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.3"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
